Concept · AI
KV Cache
AI 2026-04-20 · 2 min read · 4 backlinks
KV Cache
定义
键值缓存(Key-Value Cache),用于提高大模型推理中的缓存命中率。在 Transformer 架构中,KV Cache 存储了之前 token 的 Key 和 Value,避免重复计算。
在 Claude Code 中的应用
Claude Code 在缓存分块模块(constants/systemPromptSections.ts 中的 splitSysPromptPrefix())会负责把最终的 System Prompt 数组拆分成缓存友好的块。
明确区分缓存范围
这样明确的告诉 Claude 哪些是前缀 Prefix,就可以显式的走 KV Cache,哪些是不需要做 KV Cache 的。
打包后的结构
好处
容易提高缓存命中率,减少重复计算,提升推理速度。